es
Ranking de Productos de IA
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
Inicio
Noticias de IA
AI Diario
Guías de Monetización
Tutoriales de IA
Navegación de Herramientas de IA
Biblioteca de Productos de IA
es
Ranking de Productos de IA
Busca la dinámica global de productos de IA
Busca información global de IA y descubre nuevas oportunidades de IA
Información de Noticias
Aplicaciones de Productos
Casos de Monetización
Tutoriales de IA
Tipo :
Información de Noticias
Aplicaciones de Productos
Casos de Monetización
Tutoriales de IA
2024-10-12 11:38:17
.
AIbase
.
12.3k
OpenAI lanza MLE-bench: un conjunto de evaluación para agentes de IA
En un estudio reciente, el equipo de investigación de OpenAI presentó MLE-bench, un nuevo conjunto de evaluación para evaluar el rendimiento de los agentes de IA en ingeniería de aprendizaje automático. Este estudio se centra específicamente en 75 competiciones de ingeniería de aprendizaje automático de Kaggle, con el objetivo de probar las diversas habilidades necesarias para los agentes en el mundo real, incluyendo el entrenamiento de modelos, la preparación de conjuntos de datos y la ejecución de experimentos. Para una mejor evaluación, el equipo de investigación utilizó datos de la clasificación pública de Kaggle para establecer una base para cada